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摘 要 声音 诱发 内 光 错 觉 效 应 是 典型 的 视听 整合 错觉 现象 ， 是 指 当 视觉 闪光 刺 
激 与 间隔 100 ms 内 的 听觉 声音 刺激 不 等 数量 呈现 时 ， 被 试 知 觉 视 觉 内 光 的 数量 
与 听觉 声音 的 数量 相等 。 声 音 诱 发 内 光 错 觉 的 影响 因素 既 包 括 自 下 而 上 和 自 上 
而 下 的 因素 ， 也 包括 视听 刺激 依赖 程度 、 视 听 整 合 的 发 展 和 视听 刺激 知觉 敏感 
性 等 被 试 间 差异 因素 。 该 效应 的 产生 在 时 程 上 主要 体现 在 早期 加 工 阶段 ， 在 脑 
区 上 主要 涉及 多 处 皮层 及 皮层 下 相关 脑 区 。 未 来 研究 应 进一步 考察 注意 、 奖 赏 
和 视听 整合 方式 等 认 知 加 工 对 声音 诱发 闪光 错觉 的 影响 ， 同 时 也 应 该 关注 声音 
诱发 闪光 错 觉 对 记忆 和 学 习 的 影响 以 及 结合 计算 模型 和 神经 科学 的 手段 进一步 
探讨 其 认 知 神经 机 制 。 
关键 词 声音 诱发 闪光 错觉 ; 融合 错觉 ; 裂变 错觉 ; 多 感觉 整合 
1 前 言 

我 们 对 外 界 的 感知 来 自 于 多 个 感觉 系统 ， 不 同感 觉 通道 之 间 的 刺激 输入 会 
发 生 交 互 作用 ， 多 个 感觉 系统 之 间 的 整合 与 竞争 使 得 我 们 更 有 效 的 对 外 界 做 出 
反应 。 多 感觉 整合 是 (multisensory integration) 是 个 体 将 不 同感 觉 通 道 ( 如 视觉 、 
听觉 、 触 觉 ) 的 信息 整合 为 统一 、 连 贯 、 稳 定 的 有 意义 知觉 过 程 "。 多 感觉 整 
合 的 一 种 表现 形式 为 多 感觉 错觉 效应 (multisensory illusion)， 典 型 例子 如 麦 格 克 
视觉 主导 效应 (McGurk effect) 和 声音 诱发 办 光 错 觉 听 觉 主导 效应 (Sound-induced 
flash illusion)。 麦 格 克 效应 和 声音 诱发 内 光 错 觉 均 可 以 被 认为 是 跨 感觉 通道 的 双 
稳 态 知觉 现象 (bistable perception)， 即 当 我 们 面 对 同 样 的 刺激 产生 两 种 不 同 的 、 
相互 竞争 的 知觉 I。 虽然 在 多 数 双 通道 交互 作用 的 情况 下 ， 视 觉 通 道 占 主导 。 
但 在 时 间 维 度 上 ， 上 听觉 通道 通常 占 主 导 地 位 ， 比 如 声音 诱发 闪光 错觉 效应 所 9 和 
时 间 口 技 效 应 (temporal ventriloquism)!” 。 

声音 诱发 内 光 错 觉 是 Ladan Shams 提出 的 一 种 典型 的 以 听觉 信息 为 主导 的 
视听 整合 现象 ， 是 指 当 视觉 内 光 伴随 不 相等 数量 的 听觉 声音 在 100ms 内 相继 或 
同时 呈现 时 ， 个 体 错觉 性 的 将 视觉 内 光 的 数量 与 听觉 声音 的 数量 知觉 为 相等 
59。 该 错觉 效应 被 认为 是 多 感觉 整合 中 的 经 典 错觉 现象 ， 同 时 也 被 认为 是 跨 感 
觉 通道 的 双 稳 态 知觉 现象 。Shams 等 人 (2000, 2002) 首 次 采用 声音 诱发 内 光 错 觉 
范式 进行 研究 ， 提 出 了 在 视听 信息 整合 的 过 程 中 听觉 信息 可 以 主导 视觉 信息 的 
加 工 ， 即 产生 多 感觉 整合 的 错觉 效应 。 研 究 采 用 两 个 间隔 为 57 ms 的 听觉 声音 
并 伴随 一 个 与 第 一 个 听觉 声音 间隔 23 ms 的 视觉 闪光 快速 呈现 ， 然 后 让 被 试 判 
断 知 觉 到 的 视觉 内 光 个 数 。 结 果 发 现 ， 大 部 分 被 试 会 知觉 到 两 个 视觉 内 光 ， 这 
种 现象 通常 也 被 称 为 裂变 错觉 (Fission illusion)". PEJ, Anderson 等 人 (2004) 
研究 采用 Shams 的 研究 范式 ， 设 置 多 个 视觉 内 光 刺 激 伴 随 一 个 听觉 刺激 ， 让 被 
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试 报告 视觉 内 光 个 数 。 结 果 发 现 ， 当 两 个 视觉 内 光 伴 随 一 个 听觉 声音 时 ， 两 个 
视觉 闪光 会 被 错误 知觉 为 一 个 视觉 内 光 ， 这 种 现象 通常 也 被 称 为 融合 错觉 
(Fusion illusion) ^? , 

关于 声音 诱发 内 光 错 觉 效 应 产生 的 原因 主要 归 为 两 类 ， 其 一 是 由 于 个 体 对 
外 界 刺激 输入 的 主观 判断 导致 了 其 主观 知觉 闪光 刺激 数量 的 改变 “”;， 其 二 为 个 
体 视 知觉 敏感 性 和 判断 标准 的 降低 "”"。 造 成 个 体 主观 判断 和 知觉 敏感 性 变化 的 
一 个 最 为 重要 的 原因 是 听觉 声音 刺激 的 出 现 对 视觉 内 光 刺 激 判 断 产 生 的 因果 关 
系 知觉 ， 即 多 感觉 整合 中 的 因果 关系 "。 多 感觉 整合 中 因果 关系 知觉 的 研究 发 
现 ， 同 步 呈 现 的 无 任何 提示 意义 但 与 视觉 运动 刺激 方向 一 致 的 听觉 刺激 能 够 促 
XEUATVIE B Dn UU 。 对 于 声音 诱发 闪光 错 觉 效 应 ，Shams 等 人 (2005) 采 用 经 典 
的 声音 诱发 内 光 错 觉 范 式 考 察 听 觉 声音 刺激 的 出 现 对 视觉 内 光 刺 油 判 断 产生 的 
因果 关系 。 结 果 发 现 ， 上 听觉 声音 刺激 的 个 数 能 够 影响 被 试 对 于 视觉 内 光 刺 激 的 
知觉 ， 并 且 这 一 过 程 符合 贝 叶 斯 因果 推论 模型 一 。 

声音 诱发 内 光 错 觉 效应 一 直 是 视听 整合 研究 中 的 热点 问题 ， 自 Shams 等 人 
(2000) 提 出 该 效应 以 来 ， 大 量 研究 开始 关注 该 效应 的 影响 因素 和 神经 机 制 等 问 
题 。 但 目前 缺乏 全 面 且 系统 的 对 声音 诱发 内 光 错 觉 效 应 进行 综述 。 本 文 尝 试 对 
声音 诱发 内 光 错 觉 进行 全 面 地 综述 。 首 先 ， 从 多 角度 出 发 前 述 影响 声音 诱发 内 
光 错 觉 的 相关 因素 ; 然后 ， 从 多 种 神经 科学 技术 手段 阐述 声音 诱发 内 光 错 觉 的 
认 知 神经 机 制 ， 最 后 ， 提 出 未 来 研究 的 展望 。 


2 声音 诱发 闪光 错觉 的 影响 因素 
2.1 影响 声音 诱发 闪光 错觉 被 试 内 差异 的 因素 

声音 诱发 内 光 错 觉 的 错觉 量 会 受到 某 些 因素 的 影响 而 发 生 改变 ， 即 在 实验 
设计 中 ， 不 同 实验 条 件 之 间 的 错觉 效应 不 同 。 综 合 以 往 的 研究 发 现 ， 造 成 声音 
诱发 内 光 错 觉 被 试 内 的 因素 主要 有 自 下 而 上 的 物理 刺激 因素 和 自 上 而 下 的 认 知 
因素 两 大 类 。 
2.1.1 自 下 而 上 的 物理 刺激 因素 

刺激 的 空间 特征 可 以 影响 个 体 对 视听 信息 的 加 工效 果 ， 进 而 造成 声音 诱发 
闪光 错觉 的 被 试 内 差异 。Lewald 和 Guski (2003) 的 研究 发 现 ， 被 试 判断 闪光 刺 
激 的 个 数 既 取决 于 时 间 上 的 差异 ， 也 取决 于 空间 上 的 差异 。 研 究 表 明 ， 两 种 刺 
激 在 时 间 和 空间 上 的 接近 对 于 体验 因果 关系 至 关 重 要 509 Innes-Brown 和 
Crewther (2009) 在 Shams 等 人 (2002) 的 经 典 研究 的 基础 上 加 入 了 视听 刺激 同时 呈 
现在 同 侧 位 置 以 及 呈现 异 侧 位置 的 条 件 ， 考 察 了 视听 刺激 空间 不 一 致 性 对 声音 
诱发 内 光 错 觉 的 影响 。 结 果 表 明 ， 空 间 不 一 致 性 对 声音 诱发 闪光 错觉 的 产生 没 
有 影响 ， 但 当 视 听 刺 激 空 间 一 致 时 ， 知 觉 错 觉 敏感 性 逐步 提高 2 。Mate 等 人 
(2015) 进 一 步 考察 了 空间 一 致 性 的 作用 。 研 究 将 视觉 、 听 觉 刺 激 与 动态 连续 闪 
烁 抑制 (dynamic continuous flash suppression, DCFS) 相 结合 ， 对 两 只 眼睛 呈现 不 
同 的 视觉 刺激 。 其 中 对 遮挡 眼睛 呈现 一 组 三 个 动态 蒙 德 里 安 ， 对 目标 眼睛 时 现 
三 个 灰色 的 圆 盘 ， 位 置 分 别 为 : 左 、 中 和 右 ， 当 其 中 一 个 圆 盘 呈现 闪光 时 ， 听 
觉 刺 激 呈 现在 目标 眼睛 对 应 的 屏幕 一 侧 。 结 果 表 明 ， 同 时 发 出 的 声音 可 以 增强 
没有 意识 到 的 视觉 信号 ， 并 且 这 一 过 程 依赖 于 听觉 和 视觉 信号 的 空间 一 致 性 。 
此 外 ， 同 时 发 出 的 声音 会 根据 闪光 的 可 见 度 影响 闪光 的 位 置 。 对 于 那些 被 判断 
为 不 可 见 的 闪光， 声音 对 于 报告 的 闪光 位 置 的 空间 偏差 最 强 史 9 。Abadi 和 
Murphy (2014) 在 Shams 等 人 (2002) 范 式 的 基础 上 ， 增 添 了 空间 位 置 的 变化 ， 即 
视觉 和 听觉 刺激 运动 方向 相同 (闪光 从 左边 运动 到 右边 ， 声 音 也 是 依次 从 左 向 右 ， 


为 一 致 性 刺激 ) 与 视觉 和 听觉 刺激 运动 方向 不 同 (闪光 从 左边 运动 到 右边 ， 声 音 
从 右 向 左 ， 为 不 一 致 刺激 )。 结 果 表 明 ， 和 裂变 错觉 比 融 合 错觉 效应 量 更 大 ， 且 证 
明了 视听 刺激 组 合 (空间 一 致 性 ) 对 声音 诱发 闪光 裂 变 和 融合 错觉 均 产 生 了 影响 
81, DeLoss 和 Andersen (2015) 在 以 往 研究 的 基础 上 ， 增 大 了 研究 中 刺激 的 空间 
差异 ， 即 将 以 往 20° 空 间 差异 增加 为 50>。 结 果 发 现 ， 空 间 差异 对 声音 诱发 闪光 
错觉 无 影响 。 

刺激 强度 的 差异 会 影响 被 试 的 反应 ， 那 么 感觉 通道 间 信 号 强度 的 差异 可 能 
影响 声音 诱发 闪光 错觉 效应 的 错觉 量 大 小 。Kawabe (2009) 的 研究 改变 了 视觉 闪 
光 的 亮度 (增加 视觉 闪光 亮度 )， 考 察 是 否 能 够 通过 变化 视听 刺激 的 时 间 间 隔 产 
生 融 合 错觉 。 结 果 发 现 ， 当 视听 刺激 时 间 间 隔 接近 时 ， 声 音 更 容易 捕获 闪光 ， 
导致 融合 错觉 ， 而 且 被 试 知觉 到 的 闪光 亮度 是 增强 的 。 此 外 ， 当 部 分 声音 给 予 
高 频率 时 ， 被 试 知 觉 到 的 闪光 亮度 也 是 增强 的 。 但 当 视 听 刺 激 时 间 超 过 被 试 捕 
获 的 范围 ， 刺 激 属 性 匹配 消失 。 结 果 说 明 ， 当 感觉 通道 刺激 的 强度 发 生变 化 时 
可 以 影响 声音 诱发 融合 错觉 效应 的 强度 Andersen 等 人 (2004) 在 Shams 
(2002) 研 究 基础 上 考察 声音 属性 是 否 会 影响 声音 诱发 闪光 错觉 。 实 验 加 入 了 两 
组 声音 强度 刺激 ， 一 组 正常 声音 强度 (80dB, 与 Shams 实验 参数 相同 ) 与 一 组 低 水 
平声 音 强 度 (10dB, 接近 被 试听 觉 阔 限 )。 结 果 表 明 ， 有 裂变 错觉 在 两 组 不 同 的 声音 
强度 水 平 没 有 显著 性 差异 ， 即 裂变 错觉 不 受 声 音 强度 的 影响 ， 但 是 融合 错觉 持 
续 出 现 直 到 当 听 觉 接近 闪 限 水 平 ， 且 融合 错觉 在 低 水 平声 音 强度 下 消失 。 研 究 
发 现 ， 被 试 知 觉 到 的 融合 错觉 因 声 音 强 度 变 化 而 发 生变 化 ， 也 表现 出 当 外 界 刺 
激 输入 发 生 改变 时 ， 错 觉 现 象 会 随 着 被 试 对 刺激 的 主观 判断 而 发 生 改变 外。 研 
究 表 明 ， 和 裂变 错 觉 较 稳定 ， 不 随 声音 强度 变化 ， 而 融合 错觉 现象 稳定 性 较 弱 ， 
容易 受到 刺激 条 件 变 化 的 影响 。 此 外 ，Setti 和 Chan (2011) 探 究 了 复杂 的 视觉 刺 
激 是 否 影响 声音 诱发 闪光 错觉 现象 的 敏感 性 。 结 果 表 明 ， 被 试 在 看 到 熟悉 的 视 
觉 刺 激 时 ， 显 著 降 低 了 声音 诱发 内 光敏 感性 ， 即 错觉 数量 减少 。 研 究 也 从 侧面 
也 说 明了 视觉 刺激 的 强度 可 以 影响 声音 诱发 闪光 错觉 9。 

刺激 的 时 间 间 隔 被 认为 是 多 感觉 整合 中 的 重要 影响 因素 中 。 因 此 ， 视 听 刺 
激 的 时 间 间 隔 可 能 影响 个 体 对 于 视听 整合 信息 的 加 工 ， 进 而 造成 错觉 量 的 个 体 
内 变异 。Shams 等 人 (2002) 呈 现 一 个 视觉 闪光 刺激 伴随 多 个 听觉 声音 刺激 ， 要 求 
被 试 对 视觉 闪光 刺激 数量 进行 判断 。 研 究 发 现 ， 声 音 诱 发 内 光 错 觉 是 被 试 基于 
自己 的 主观 视 知觉 ， 并 非 由 于 任务 难度 或 知觉 偏向 所 造成 。 并 且 一 个 强 裂 变 错 
觉 的 产生 需要 两 个 声音 刺激 的 时 间 间 隔 低 于 70 ms。 而 裂变 错觉 减弱 ， 则 需要 
两 个 声音 刺激 的 时 间 间 隔 大 于 150 ms。 研 究 说 明了 两 个 声音 刺激 的 时 间 窗 可 以 
影响 裂变 错觉 知觉 外。Zhang 和 Chen (2006) 使 用 fMRI 技术 考察 裂变 错觉 引起 
的 视觉 和 听觉 之 间 的 跨 通 道 交 互 作用 。 结 果 发 现 ， 当 听觉 和 视觉 刺激 之 间 的 刺 
激 间 隔 延 迟 为 25 ms 时 ， 视 觉 皮 层 的 功能 磁 共 振 成 像 信 号 对 裂变 错觉 的 反应 明 
显 高 于 真实 的 单 闪光 。 当 延迟 时 间 延 长 到 300 ms 时 ， 这 种 信号 增强 消失 了 。 研 
究 表明 ， 裂 变 错觉 效应 对 视觉 皮层 的 脑 活动 具有 显著 的 影响 ， 这 种 影响 程度 对 
刺激 间 延 迟 具 有 动态 敏感 性 24。 近 期 ，Kostaki 和 Vatakis (2016) 进 一 步 采 用 不 同 
时 间 间 隔 的 声音 诱发 内 光 错 觉 范式 考察 不 均等 数量 的 感觉 通道 刺激 输入 之 间 的 
竞争 。 结 果 发 现 ， 裂 变 错觉 在 不 同 SOA 下 会 产生 不 同 的 错觉 强度 "2 。 

总 体 而 言 ， 声 音 诱发 闪光 错觉 效应 一 方面 容易 受到 物理 刺激 因素 影响 而 产 
生 个 体内 变异 ， 另 一 方面 又 具有 较 强 的 稳定 性 ， 即 不 容易 消失 ， 特 别 是 裂变 错 
觉 ， 其 不 会 因为 视听 刺激 属性 的 变化 减弱 或 消失 ， 也 说 明了 裂变 错觉 是 一 种 稳 


定 的 错觉 现象 ， 且 当 声 音 的 时 间 间 隔 较 近 时 或 当 视 觉 刺 激 呈 现在 外 周 视野 时 ， 
裂变 错觉 效应 最 大 。 但 是 融合 错觉 在 部 分 研究 中 没有 发 现 ， 可 能 由 于 研究 中 实 
验 条 件 、 实 验 设 备 等 影响 ， 并 且 融 合 错觉 会 受到 刺激 物理 属性 (如 声音 强度 ) 的 
影响 使 之 减弱 或 消失 ， 当 视听 刺激 的 时 间 间 隔 较 短 时 ， 更 容易 发 生 融 合 错觉 现 
象 。 因 此 ， 相 对 裂变 错觉 而 言 ， 融 合 错觉 效应 较 弱 且 不 稳定 。 
2.1.2 自 上 而 下 的 认 知 因素 

刺激 物理 属性 的 改变 对 声音 诱发 内 光 错 觉 存在 影响 。 但 即使 面 对 同 样 的 物 
理 刺 激 ， 个 体 的 认 知 状态 不 同 ， 也 可 能 造成 声音 诱发 内 光 错 觉 的 错觉 量 不 同 ， 
也 就 是 双 稳 态 知觉 过 程 中 ， 尽 管 自 下 而 上 的 刺激 保持 不 变 ， 但 产生 与 不 产生 错 
觉 在 感知 过 程 中 交 蔡 出 现 。 此 外 ， 相 对 于 物理 刺激 这 种 自 下 而 上 的 影响 因素 ， 
自 上 而 下 的 认 知 因素 在 生活 中 更 为 常见 。 目 前 已 有 的 研究 主要 围绕 注意 、 反 馈 
方式 和 认 知 期 望 等 因素 进行 了 研究 。 

Mishra 等 人 (2010) 提 出 声音 诱发 视觉 错觉 不 仅 是 跨 通 道 整合 的 结果 ， 应 该 
还 有 注意 分 配 的 作用 。 研 究 采 用 ERP 技术 ， 在 Shams 等 人 (2002) 范 式 基 础 上 增 
加 了 刺激 的 空间 位 置 (高 视野 和 低 视 野 ) 与 是 否 注 意 (注意 和 不 注意 ) 这 两 个 变量 ， 
要 求 被 试 在 高 视野 或 低 视 野 判断 视觉 闪光 刺激 数量 。 研 究 表明 ， 在 低 视野 刺激 
rH, PDI20/PDI10 成 分 位 于 腹 侧 枕 、 显 外 纹 视 觉 皮层 ， 而 随后 的 PD180 和 
ND250/ND240 成 分 位 于 颗 上 回 。 而 枕 里 皮层 和 矣 上 回 被 认为 是 多 感觉 通道 信息 
产生 交互 的 脑 区 。 这 些 ERP 成 分 与 之 前 Mishra 等 人 (2007) 研 究 发 现 的 声音 诱发 
闪光 错觉 的 神经 机 制 的 成 分 有 高 相似 性 ， 并 且 在 此 研究 中 加 入 注意 分 配 使 得 这 
些 成 分 均 被 增强 。 这 些 结果 证 明了 注意 分 配对 跨 通 道 交 互 与 声音 诱发 闪光 错觉 
的 关系 存在 影响 ， 说 明了 裂变 错觉 并 不 全 是 自动 整合 加 工 的 结果 ， 还 有 注意 分 
配 参 与 了 视觉 和 听觉 信号 的 整合 中。 除了 注意 分 配 能 够 影响 声音 诱发 内 光 错 觉 
之 外 ， 内 源 性 注意 也 能 够 影响 声音 诱发 内 光 错 觉 效 应 。Georgios 和 Julian (2018) 
的 研究 考察 了 内 源 性 注意 对 声音 诱发 内 光 错 觉 的 影响 。 结 果 发 现 ， 在 高 工作 记 
忆 负 和 荷 下 ， 被 试 感知 到 的 闪光 错觉 量 增 加 ， 且 与 反应 偏差 无 关 。 证 明了 视听 整 
合 可 以 被 认 知 资源 的 数量 调节 ， 为 非 言 语 视听 刺激 的 整合 在 注意 资源 减少 的 情 
况 下 得 到 增强 提供 了 证 据 ， 因 此 支持 了 自 上 而 下 的 注意 控制 在 多 感觉 整合 中 发 
挥 重 要 作用 中 。 同 样 地 ， 于 和 被 等 人 (2017) 采 用 经 典 的 声音 诱发 闪光 错觉 的 范式 ， 
通过 操纵 注意 资源 的 分 配方 式 考察 了 主动 注意 听觉 通道 的 声音 刺激 对 声音 诱发 
闪光 错觉 产生 的 影响 。 结 果 发 现 ， 裂 变 错 觉 受 到 注意 资源 分 配 程度 的 影响 ， 但 
融合 错觉 不 会 受到 注意 资源 分 配 的 影响 中 。 近 期， 张 明 等 人 (2018) 将 注意 以 内 
源 性 的 方式 指向 视觉 通道 或 者 听觉 通道 ， 考 察 了 基于 通道 的 内 源 性 注意 对 声音 
诱发 闪光 错 觉 的 影响 。 结 果 发 现 ， 当 注意 内 源 性 地 指向 视觉 通道 时 ， 裂 变 错觉 
的 量 显著 减 小 ， 当 注意 内 源 性 地 指向 听觉 通道 时 ， 有 裂变 错觉 的 量 存在 增 大 的 趋 
势 。 说 明了 基于 通道 的 内 源 性 注意 可 以 影响 声音 诱发 闪光 错觉 中 的 裂变 错觉 ， 
但 不 影响 融合 错觉 2 。 

Rosenthal 等 人 (2009) 采 用 Shams 等 人 (2002) 的 研究 范式 ， 在 被 试 完成 任务 时 
给 予 被 试 任务 判断 正确 与 否 的 反馈 ， 探 讨 了 反馈 方式 是 否 可 以 影响 声音 诱发 内 
光 错 觉 现象 。 结 果 表 明 ， 无 论 给 予 被 试 正确 与 否 的 反馈 ， 均 不 能 显著 减 小 或 者 
消除 这 种 错觉 现象 ， 即 这 种 声音 诱发 内 光 错 觉 现象 较为 稳定 。 但 是 ， 当 给 予 被 
试 货币 奖励 ( 即 依 据 被 试 结果 的 正确 率 给 予 相应 的 奖励 ) 时 ， 这 种 错觉 性 的 主导 
效应 却 有 下 降 的 趋势 2 。Van Erp 等 人 (2013) 进 一 步 认 为 ， 既 然 脑 成 像 上 可 以 发 
现 错觉 闪光 和 真实 闪光 在 视觉 皮层 的 激活 有 差异 ， 那 么 在 反馈 训练 中 ， 虽 然 反 


馈 和 没有 反馈 现象 无 显著 差异 ， 但 反馈 在 一 定 程度 上 降低 知觉 到 的 错觉 。 因 此 ， 
他 们 认为 以 往 的 研究 忽略 了 真实 闪光 和 错觉 闪光 在 对 比 度 、 强 度 和 持续 时 间 上 
差异 ， 并 错误 地 假定 真实 和 错觉 内 光 有 相似 知觉 而 且 不 能 区 分 。 因 此 ， 他 们 提 
出 增加 反应 类 型 ， 即 在 反应 一 个 闪光 和 两 个 闪光 的 基础 上 ， 增 加 了 “ 某 些 事物 
不 同 于 一 个 或 两 个 内 光 ”， 记 为 反应 类 型 3。 结果 发 现 ， 被 试 在 按键 反应 时 ， 
选择 反应 类 型 3 中 有 44% 的 是 错觉 内 光 ， 有 4% 是 真实 闪光 ， 表 明 可 能 真实 闪光 
和 错觉 闪光 在 强度 、 对 比 度 和 持续 时 间 等 特性 上 存在 差异 ， 而 被 试 可 以 通过 自 
己 来 判断 出 真实 闪光 。 此 外 ， 冲 突 探 测 (conflict detection) 也 可 能 会 影响 被 试 的 
判断 反应 。 因 为 被 试 在 进行 判断 时 ， 可 能 没有 区 分 真实 和 错觉 闪光 之 间 的 定性 
差异 ， 而 是 可 能 注意 到 了 视觉 脉冲 和 听觉 脉冲 之 间 的 “冲突 ”。 在 匹配 条 件 中 ， 
闪光 和 声音 脉冲 的 时 间 和 数量 是 相同 的 。 而 在 错觉 闪光 试 次 中 ， 闪 光 和 声音 脉 
冲 的 时 间 ( 视 听 刺 激 时 间 间 隔 23 ms) 和 数量 (声音 数量 多 于 或 少 于 闪光 数量 ) 是 不 
同 的 。 因 此 即使 在 指导 语 中 说 明 被 试 反 应 只 依据 被 试 视 知觉 ， 但 被 试 对 这 种 冲 
突 探测 却 体 现在 被 试 反应 上 。 这 意味 着 被 试 并 非 依 据 错 觉 和 真实 闪光 的 定性 特 
征 ， 而 是 依据 视觉 和 听觉 信息 之 间 的 冲突 进行 结果 判断 "站 。 以 上 研究 表明 ， 正 
确 的 结果 反馈 并 没有 显著 影响 声音 诱发 内 光 错 觉 现 象 。 因 此 ， 可 以 从 实验 结果 
推断 ， 错 误 的 结果 反馈 也 不 会 显著 影响 声音 诱发 内 光 错 觉 ， 并 且 虚 假 反馈 可 能 
会 增加 被 试 报告 裂变 错觉 的 比例 。 通 过 Van Erp 等 人 (2013) 的 实验 可 以 发 现 ， 被 
试 自 身 可 能 可 以 区 分 真实 闪光 和 错觉 闪光 ， 但 具体 被 试 是 依据 什么 判断 以 及 是 
否 存 在 冲突 探测 的 影响 都 有 不 确定 性 ， 还 需要 进一步 的 研究 。 综 上 这 些 研 究 表 
明 ， 直 接 结果 反馈 ( 即 说 明 被 试 判断 正确 与 否 ) 对 声音 诱发 内 光 错 觉 没 有 显著 影 
响 ， 但 当 增 加 结果 反馈 类 型 时 ( 即 反 应 类 型 增加 )， 可 以 改变 被 试 知觉 到 的 闪光 
H Ii o 

除了 注意 和 反馈 方式 ， 还 有 研究 探讨 了 自 上 向 下 的 认 知 期 望 对 声音 诱发 闪 
光 错 觉 的 影响 。 研 究 利 用 改变 指导 语 与 实验 试 次 比例 来 操控 认 知 期 望 ， 实 验 1 
和 实验 2 采用 的 三 个 指导 语 条 件 一 致 (请 判断 闪光 个 数 ”、“ 含 有 两 个 闪光 的 
条 件 为 80%， 判 断 闪 光 个 数 ” 和 “含有 一 个 闪光 的 条 件 为 80%， 判 断 闪 光 个 
数 ”)， 实 验 试 次 比例 不 同 ; 实验 3 中 采用 三 个 相同 指导 语 (请 判断 闪光 个 数 ”、 
“所 有 实验 条 件 出 现 的 概率 相等 ， 判 断 闪 光 个 数 ” 和 “所 有 实验 条 件 出 现 的 概 
率 相 等 ， 判 断 闪 光 个 数 )， 实 验 试 次 比例 与 实验 1 相 一 致 。 结 果 表 明 ， 当 指导 语 
的 提示 比例 与 试 次 的 实际 比例 相 一 致 时 ， 可 以 显著 提高 观察 者 的 判断 准确 性 ， 
反应 时 变 快 ， 当 指导 语 的 提示 比例 与 试 次 的 实际 比例 不 一 臻 时， 指导 语 依然 可 
以 影响 观察 者 在 判断 裂变 错觉 时 的 准确 性 和 反应 时 。 研 究 表明 ， 自 上 而 下 的 认 
知 预期 可 以 显著 减少 裂变 错觉 ， 加 速 被 试 的 判断 。 而 在 融合 错觉 中 这 种 影响 并 
不 明显 ， 可 能 是 由 于 融合 错觉 相对 不 稳定 性 所 导致 的 59 。 

综 上 所 述 ， 在 声音 诱发 闪光 错觉 的 被 试 内 变异 研究 中 ， 研 究 者 既 关 注 了 自 
下 而 上 的 物理 刺激 因素 对 声音 诱发 闪光 错觉 的 影响 ， 同 时 也 关注 了 一 些 认 知 因 
素 ， 特 别 是 自 上 而 下 的 认 知 因素 对 声音 诱发 闪光 错觉 的 影响 。 物 理 刺激 因素 更 
多 地 体现 了 声音 诱发 闪光 错觉 现象 的 产生 是 由 于 在 不 同 的 物理 刺激 条 件 下 被 试 
视 知觉 敏感 性 降低 中。 例如 ，Kumpik 等 人 (2014) 的 研究 通过 降低 视觉 刺激 的 空 
间 可 靠 性 探讨 视觉 知觉 敏感 性 对 声音 诱发 内 光 错 觉 的 影响 。 研 究 发 现 ， 声 音 诱 
发 内 光 错 觉 在 外 周 视野 更 常见 ， 且 被 斌 知觉 到 的 裂变 错觉 数量 大 于 融合 错觉 数 
量 ， 说 明 声 音 诱 发 内 光 错 觉 是 被 试 对 视野 范围 呈现 闪光 的 知觉 敏感 性 决定 。 自 
上 而 下 的 认 知 因素 则 更 多 地 体现 了 声音 诱发 闪光 错觉 现象 的 产生 是 由 于 被 试 对 


外 界 刺 激 输入 的 主观 判断 导致 了 被 试 主观 知觉 内 光 刺 激 数量 的 改变 。 例 如 ， 
Shams 等 人 (2002) 研 究 认 为 ， 声 音 诱 发 风光 错觉 是 被 试 基于 的 主观 视 知觉 ， 并 非 
由 于 任务 难度 或 物理 刺激 不 同 造成 的 知觉 偏向 所 造成 ?1 。 

2.2 影响 声音 诱发 内 光 错 觉 被 试 间 差 异 的 因素 

声音 诱发 内 光 错 觉 效 应 中 ， 不 同 被 试 的 个 体 之 间 存 在 错觉 量 的 差异 ， 不 同 
组 别 的 被 试 之 间 也 存在 声音 诱发 内 光 错 觉 的 差异 。Mishra 等 人 (2007) 的 研究 发 
现 ， 这 种 错觉 现象 在 个 体 间 的 差异 是 较 大 的 ， 闪 光 错 觉 发 生 的 比例 范围 在 个 体 
间 是 396-8696?" 。 下 面 将 分 成 三 个 相关 因素 进行 阐述 ， 主 要 包括 对 视听 信息 依 
赖 程度 、 视 听 整 合 发 展 以 及 视听 刺激 知觉 敏感 性 。 

2.2.1 视听 刺激 依赖 程度 

声音 诱发 内 光 错 觉 的 个 体 差异 可 能 来 自 个 体 对 视觉 或 听觉 信息 依赖 程度 的 
差异 ， 即 对 视觉 信息 依赖 程度 高 的 个 体 不 易 受 到 听觉 信息 的 影响 ， 进 而 错觉 量 
较 小 ; 对 听觉 信息 依赖 程度 高 的 个 体 容易 受到 听觉 信息 影响 ， 进 而 错觉 量 也 较 
大 。 一 项 研究 通过 对 比 了 音乐 家 和 非 音乐 家 对 于 声音 诱发 内 光 错 觉 这 种 视听 信 
息 整合 之 间 的 差异 。 研 究 发 现 ， 受 过 音乐 训练 的 人 能 够 更 快 更 准确 地 加 工 视 听 
线索 ， 并 且 他 们 声音 诱发 闪光 错觉 的 能 力 增强 以 及 视听 信息 绑 定 的 时 间 窗 口 更 
短 嘲 。 这 可 能 是 因为 音乐 家 通过 长 期 训练 使 得 听觉 信息 的 加 工 能 力 增强 。 另 一 
项 研究 表明 ， 相 比 于 正常 双眼 被 试 ， 早 年 失去 一 只 眼睛 功能 的 单眼 被 试 声音 诱 
发 闪光 错觉 的 错觉 量 减 小 喇 ， 说 明了 视听 整合 中 出 现 的 适应 补偿 现象 是 由 于 单 
民 被 试 的 视觉 输入 的 降低 所 引起 的 。 以 往 的 研究 表明 ， 当 单一 感觉 信息 不 可 靠 
时 ， 人 脑 可 以 通过 整合 多 感觉 信息 来 增强 对 外 界 的 感知 ， 即 当知 觉 单一 感觉 信 
息 的 能 力 下 降 时 ， 多 感觉 信息 对 知觉 的 影响 更 大 。 对 于 单眼 被 试 来 说 ， 当 视觉 
减弱 时 ， 听 觉 可 以 提供 关于 环境 特性 的 信息 。 

对 特殊 人 群 ( 联 觉 者 、 偏 头痛 患者 、 多 发 性 硬化 患者 、 弱 视 者 、 自 闭 症 谱系 
障碍 患者 、 轻 度 认 知 障碍 被 试 和 精神 分 裂 症 患者 ) 的 声音 诱发 内 光 错 觉 研 究 也 支 
持 上 述 观 点 ， 即 对 视听 信息 依赖 程度 上 的 差异 可 能 影响 声音 诱发 闪光 错 觉 的 个 
体 间 差异 。Whittingham 等 人 (2014) 的 研究 发 现 ， 联 觉 者 随 着 年 龄 的 增长 ， 声 音 
诱发 闪光 错觉 的 错觉 量 减 小 喇 。Brighina 等 人 (2015) 的 研究 发 现 ， 对 于 偏 头 痛 吓 
者 ， 特 别 是 在 发 作 期 间 ， 当 呈现 一 个 视觉 闪光 与 两 个 听觉 声音 结合 时 ， 有 裂变 错 
觉 减 小 甚至 消失 5 。Yalachkov 等 人 (2019) 通 的 研究 发 现 ， 多 发 性 硬化 患者 感知 
到 的 闪光 错觉 量 多 于 正常 健康 被 试 中 7。 Narinesingh 等 人 (2017) 的 研究 发 现 ， 对 
于 双眼 观察 且 上 听觉 声音 刺激 呈现 在 前 的 裂变 错觉 ， 随 着 刺激 呈现 的 不 同步 性 增 
加 ， 正 常 被 试 表现 出 错觉 强度 降低 ， 而 弱视 患者 的 错觉 强度 则 保持 不 变 ， 即 弱 
视 组 的 时 间 绑 定 窗 口 更 宽 。 对 于 视觉 闪光 刺激 呈现 在 前 的 融合 错觉 ， 弱 视 个 体 
错觉 强度 降低 "9。Bao 等 人 (2017) 的 研究 发 现 ， 自 闭 症 谱系 障碍 患者 和 正常 发 
育 个 体 都 对 裂变 错觉 具有 敏感 性 ， 但 是 自 闭 症 谱系 障碍 患者 更 容易 出 现 融 合 错 
me), Chan 等 人 (2015) 的 研究 发 现 ， 在 较 长 的 听觉 时 间 间 隔 内 ， 与 健康 被 试 相 
比 ， 轻 度 认 知 障碍 被 试 感知 到 更 多 的 错觉 呈 。Vanes 等 人 (2016) 的 研究 发 现 ， 精 
神 分 裂 症 患者 的 融合 错觉 量 显 着 降低 加 。 同 样 地 ，Ha8 等 (2017) 通 过 使 用 不 同 
时 间 间 隔 的 刺激 诱发 裂变 错觉 ， 发 现 了 精神 分 裂 症 患 者 与 健康 被 试 在 视听 整合 
方面 存在 差异 "中 。 近 期 ，Gieseler 等 人 (2018) 考 察 了 使 用 助听器 的 老年 人 与 未 使 
用 助听器 的 轻 度 听力 损失 者 ( 非 使 用 助听器 者 ) 在 声音 诱发 内 光 错 觉 量 上 的 差异 ， 
并 通过 改变 刺激 开始 的 不 同步 性 来 考察 相应 的 整合 窗口 。 结 果 发 现 ， 轻 度 听 力 
损伤 和 助听器 的 使 用 都 会 影响 错觉 量 的 大 小 ， 原 因 可 能 是 因为 助听器 的 使 用 会 
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总 体 而 言 ， 不 同 群 体 之 间 的 比较 体现 出 了 认 知 加 工 过 程 中 对 视觉 和 听觉 信 
息 的 依赖 程度 能 够 影响 声音 诱发 内 光 错 觉 效 应 出 现 的 个 体 差异 。 具 体 表现 为 ， 
对 视觉 信息 依赖 程度 高 的 个 体 不 易 受到 听觉 信息 的 影响 ， 进 而 导致 声音 诱发 内 
光 错 觉 这 种 听觉 刺激 驱动 的 错觉 量 减 小 ， 对 听觉 信息 依赖 程度 高 的 个 体 容易 受 
到 听觉 信息 影响 ， 进 而 导致 这 种 声音 诱发 内 光 错 觉 这 种 听觉 主导 效应 增 大 。 然 
而 ， 目 前 不 同 群体 的 研究 证 据 除 了 被 试 在 视听 信息 依赖 程度 的 差异 之 外 ， 还 可 
能 会 存在 其 他 的 影响 因素 影响 错觉 量 的 大 小 。 未 来 的 研究 一 方面 可 以 考察 其 他 
被 试 群体 声音 诱发 内 光 错觉 的 错觉 量 大 小 为 视听 信息 依赖 程度 这 一 影响 因素 提 
供 证 据 ， 更 为 重要 的 是 ， 可 以 在 现 有 研究 的 基础 上 进一步 量化 和 深入 考察 视听 
信息 依赖 程度 如 何 影响 这 些 被 试 群体 的 声音 诱发 内 光 错 觉 。 
2.2.2 视听 整合 的 发 展 

大 脑 为 了 有 效 整合 来 自 不 同感 觉 通 道 的 信息 使 用 了 时 间 绑 定 窗口 。 以 往 研 
究 发 现时 间 绑 定 窗口 的 宽度 随 着 年 龄 的 增长 而 增加 ， 以 便 在 感觉 转换 下 降 时 最 
大 限度 利用 多 感觉 通道 输入 的 信息 。DeLoss 等 人 (2013) 使 用 声音 诱发 闪光 错觉 
范式 考察 声音 诱发 闪光 错 觉 是 否 存在 年 龄 差异 。 结 果 发 现 ， 与 年 轻 人 相 比 ， 老 
年 人 抑制 无 关 跨 通道 信息 能 力 降低 ， 整 合 信息 能 力 更 强 ， 即 表现 出 更 多 的 错觉 
现象 ， 这 一 研究 表明 ， 多 感觉 整合 与 年 龄 存在 分 离 效 应 ， 老 年 人 更 容易 受到 多 
感觉 整合 的 影响 外。McGovern 等 人 (2014) 的 研究 发 现 ， 老 年 人 即使 在 刺激 的 时 
间 间 隔 (SOA) 较 大 的 情况 下 也 会 产生 裂变 错觉 。 但 是 对 于 融合 错觉 ， 老 年 人 和 
年 轻 人 之 间 的 错觉 量 并 不 存在 显著 差异 "”。 同 样 地 ，Chan 等 人 (2017) 比 较 了 年 
轻 人 和 老年 人 声音 诱发 闪光 错觉 任务 的 错觉 量 。 结 果 发 现 ， 在 较 长 的 SOA 中 老 
年 人 比 年 轻 人 更 容易 产生 声音 诱发 闪光 错 觉 允 。 随 后 ，Chan 等 人 (2018) 考 察 了 
年 轻 人 与 老年 人 在 面 对 长 (E70、+t110、+150、+190 4112230) 53 (2-70. +150 和 
+230) 两 个 不 同 SOA 时 ， 是 否 对 声音 诱发 的 闪光 错觉 表现 出 不 同 的 易 感 性 。 结 
果 发 现 ， 这 两 组 被 试 在 小 范围 的 不 同步 性 时 ， 对 错觉 表现 出 更 高 的 易 感性 ， 但 
是 仅 限 于 较 长 的 时 间 窗 。 另 外 ， 研 究 也 发 现 改 变 SOA 的 量 确实 会 影响 对 感知 到 
错觉 量 的 敏感 性 "7。 

近期 ，Hernéndez 等 人 (2019) 的 研究 提供 了 关于 声音 诱发 内 光 错 觉 的 第 一 个 
横向 大 数据 研究 的 证 据 。 研 究 以 3955 名 50 岁 以 上 的 成 年 人 为 样本 ， 考 察 了 年 
龄 、 认 知 状况 和 性 别 对 声音 诱发 内 光 错 觉 敏感 性 的 影响 。 结 果 发 现 ， 声 音 诱 发 
闪光 错觉 敏感 性 的 研究 结果 与 先前 的 研究 一 致 ， 认 为 老化 在 多 感觉 加 工 和 增 大 
的 时 间 绑 定 窗口 中 起 作用 ， 即 年 龄 越 大 、 蒙 特 利 尔 认 知 评估 (MoCA) 分 数 越 低 ， 
FEMA PDC vut EU. O'Brien 等 人 (2017) 采 用 声音 诱发 闪光 错觉 
任务 考察 老年 人 的 视听 整合 能 力 ， 老 年 人 在 运动 前 后 (持续 时 间 在 60 到 80 分 钟 
之 间 ) 接 受 测试 。 结 果 发 现 ， 健 康 并 经 常 锻 炼 的 老年 人 显示 出 更 有 效 的 多 感觉 加 
TAH. Merriman 等 人 (2015) 考 察 了 平衡 功能 的 改善 是 否 与 老年 人 多 感觉 加 
工 能 力 的 改善 有 关 ， 尤 其 是 那些 过 去 有 跌倒 经 历 的 老年 人 。 研 究 对 76 名 健康 且 
有 跌倒 倾向 的 老年 人 进行 平衡 训练 ， 并 使 用 声音 诱发 内 光 融 合 错觉 任务 考察 多 
感觉 加 工 能 力 是 否 改善 。 结 果 发 现 ， 易 跌倒 老年 人 的 平衡 功能 的 改善 和 多 感觉 
整合 的 改善 之 间 存 在 相关 。 表 明了 平衡 训练 干预 可 以 增强 老年 人 的 身体 姿势 控 
制 能 力 ， 对 易 跌倒 的 老年 人 产生 更 有 效 的 多 感觉 加 工 吕 。 

上 述 研究 表明 老年 人 和 年 轻 人 视听 整合 的 时 间 窗 大 小 影响 了 声音 诱发 闪光 
普 觉 的 效应 量 ， 那 么 什么 原因 造成 了 两 组 被 试 群体 视听 整合 的 时 间 窗 的 差异 ? 


Cecere 等 人 (2015) 发 现 声音 诱发 风光 错觉 现象 的 视听 刺激 整合 时 间 窗 是 100 ms 
左右 ， 而 o 频段 的 振荡 活动 周期 也 是 100 ms 左右 ， 因 此 他 们 认为 ，a 频段 的 振 
荡 周 期 可 以 调节 视听 事件 整合 的 时 间 窗 。 研 究 也 发 现 ， 个 体 a 频率 (individual 
alpha frequency, IAF) 峰 值 和 错觉 时 间 窗 的 大 小 之 间 呈 正 相 关 关 系 。 此 外 研究 也 
发 现 ， 错 觉 的 时 间 窗 随 o 频率 的 振荡 活动 而 变化 。 说 明了 a 振荡 可 以 调节 闪光 
普 觉 的 整合 时 间 窗 。 因 此 ，Cecere 等 人 认为 ， 闪 交错 觉 是 在 快速 视觉 刺激 加 工 
的 关键 时 间 窗 内 由 连续 的 声音 诱发 视觉 皮层 兴奋 性 导致 的 突然 变化 所 引起 的 现 
RPI, Keil 和 Senkowski (2017) 同 样 通过 脑 电 研究 考察 了 个 体 a 频率 与 个 体 知觉 
闪光 错觉 的 关系 。 结 果 在 验证 Cecere 等 人 (2015) 的 基础 上 ， 扩 展 了 原 有 结果 。 
表明 了 个 体 a 波 频 率 与 内 光 错 觉 的 错觉 率 呈 负 相 关 ， 即 低 IAF 个 体 视 听觉 错觉 
更 强 。 并 且 源 分 析 表 明 视觉 皮层 ， 特 别 是 距 状 沟 参 与 表征 2。 

综 上 所 述 ， 个 体 多 感觉 整合 能 力 越 强 ， 声 音 诱发 闪光 错觉 量 越 大 。 相 比 于 
年 轻 人 ， 老 年 人 声音 诱发 闪光 错觉 中 的 裂变 错觉 和 融合 错觉 效应 均 更 大 3。 之 
所 以 表现 多 感觉 错觉 效应 增 大 的 原因 在 于 老年 人 多 感觉 整合 能 力 可 能 比 年 轻 人 
更 强 。 例 如 ， 以 往 关 于 多 感觉 整合 年 龄 效应 的 研究 表明 老年 人 的 多 感觉 整合 能 
力 强 于 年 轻 人 中。 关于 老年 人 多 感觉 整合 效应 增强 的 原因 Laurienti 等 人 
(2006) 认 为 可 能 是 由 于 补偿 机 制 ， 即 多 感觉 通道 信息 的 加 工 能 力 较 强 能 够 补偿 
单一 感觉 通道 信息 加 工 能 力 的 不 足 中 。 以 往 研究 表明 ， 当 单一 感觉 通道 信息 不 
可 靠 时 ， 人 脑 可 以 通过 整合 多 感觉 通道 的 信息 来 增强 对 外 界 的 感知 ， 即 当知 觉 
单一 感觉 通道 信息 的 加 工 能 力 下 降 时 ， 多 感觉 通道 信息 的 加 工 对 个 体 的 知觉 过 
程 影响 更 大 。 对 于 老年 人 来 说 ， 当 视觉 通道 信息 减弱 时 ， 听 觉 通 道 信 息 可 以 作 
为 补偿 提供 更 多 关于 环境 特性 的 信息 5 。 

2.2.3 视听 刺激 知觉 敏感 性 

声音 诱发 闪光 错觉 是 视听 整合 的 一 种 现象 ， 被 试 对 视觉 刺激 和 听觉 刺激 加 
工 过 程 中 早期 感知 觉 阶段 的 差异 也 可 能 影响 错觉 效应 的 大 小 。 有 研究 在 Shams 
等 人 (2002) 研 究 的 基础 上 上， 考察 感 知觉 敏感 性 对 声音 诱发 风光 错觉 的 影响 。 结 
果 发 现 ， 声 音 诱发 闪光 错觉 的 错觉 量 受到 知觉 敏感 性 的 影响 ， 即 知觉 敏感 性 越 
低 ， 闪 光 错 觉 量 越 大 中 。Kumpik 等 人 (2014) 考 察 了 听觉 刺激 影响 视觉 感知 可 能 
性 的 空间 因素 。 研 究 者 通过 操纵 视觉 与 听觉 刺激 的 空间 一 致 性 、 声 音 定 位 信和 号 
的 类 型 、 视 觉 刺 激 的 离心 度 和 大 小 ， 考 察 视 觉 知 觉 敏 感度 在 多 大 程度 上 决定 了 
闪光 错觉 的 出 现 。 信 号 检测 论 结果 发 现 ， 声 音 诱发 闪光 错觉 在 外 周 视 野 更 常见 ， 
且 被 试 知觉 到 的 裂变 错觉 量 大 于 融合 错觉 量 "50 。 

鉴于 知觉 敏感 性 能 够 影响 声音 诱发 内 光 错 觉 的 错觉 量 ，De Haas 等 人 (2012) 
的 研究 进一步 提出 了 人 类 大 脑 结构 的 差异 造成 了 个 体 对 声音 诱发 内 光 错 觉 敏感 
性 的 差异 。 研 究 结 果 发 现 ， 当 初级 视觉 皮层 局 部 (BA17&18) 的 灰质 体积 较 小 时 ， 
被 试 更 容易 产生 错觉 ， 并 且 无 论 视觉 刺激 旺 现 在 上 视野 还 是 下 视野 ， 灰 质 体积 
与 被 试 的 闪光 错觉 量 均 明 负 相关 。 研 究 表明 ， 个体 大 脑 初级 视觉 皮层 的 灰质 体 
积 与 声音 诱发 闪光 错觉 有 关口 。 此 外 ， 已 有 研究 证 明 伽 马 波 段 N30 Hz) 在 多 感 
觉 信 息 加 工 中 起 着 重要 作用 ， 颗 上 沟 的 Y 氮 基 丁 酸 (GABA) 神 经 传递 有 助 于 产生 
y 带 振荡 (gamma band oscillation, GBO)， 其 可 通过 激活 代谢 型 谷 氨 酸 受 体 来 维持 
57. RAL, Balz 等 人 (2016) 提 出 GABA 和 谷 氨 酸 系 统 的 差异 可 能 会 导致 多 感觉 
言 息 加 工 的 个 体 差异 。 通 过 EEG 和 MRI 两 种 研究 方法 ， 考 察 了 GABA FRE 
沟 (STS) 中 的 谷 氨 酸 浓度 、 局 部 GBO 和 声 诱发 闪光 错觉 的 错觉 量 之 间 的 关系 。 
研究 发 现 ，GABA 水 平 通过 其 对 GBO 的 调节 塑造 视听 感知 的 个 体 差 异 ，STS 中 


GABA 浓度 与 GBO 功率 之 间 存 在 很 强 的 正 相 关 关 系 ，GABA 浓度 与 个 体感 知 闪 
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综 上 所 述 ， 视 觉 和 听觉 通道 中 刺激 知觉 敏感 性 能 够 影响 声音 诱发 闪光 错觉 ， 
表现 为 视觉 敏感 性 降低 ， 闪 光 错 觉 量 越 大 。 并 且 研 究 发 现 这 种 敏感 性 与 大 脑 结 
构 的 差异 存在 关系 。 鉴 于 刺激 的 知觉 敏感 性 能 够 影响 声音 诱发 闪光 错觉 ， 近 期 
Sun 等 人 (2020) 通 过 在 声音 诱发 闪光 错觉 刺激 经 典范 式 之 前 重复 呈现 听觉 通道 的 
刺激 ， 考 察 听觉 通道 刺激 的 知觉 敏感 性 变化 如 何 影 响声 音 诱 发 闪光 错觉 。 研 究 
结果 发 现 ， 听 觉 通 道 刺激 的 重复 呈现 可 以 使 得 听觉 声音 刺激 的 敏感 性 下 降 ， 进 
而 使 得 错觉 量 降低 喇 。 因 此 ， 被 试 对 于 视觉 和 听觉 知觉 敏感 性 性 的 改变 也 被 认 
为 是 声音 诱发 闪光 错觉 现象 产生 的 主要 原因 "" 汶 。 目 前 现 有 的 研究 均 从 单一 的 
视觉 通道 刺激 和 听觉 通道 刺激 的 知觉 敏感 性 变化 考察 其 如 何 影响 声音 诱发 闪光 
背 觉 ， 未 来 的 研究 可 以 从 视觉 刺激 和 听觉 刺激 知觉 敏感 性 相对 变化 的 角度 考察 
声音 诱发 闪光 错觉 的 错觉 量 大 小 如 何 受到 刺激 知觉 敏感 性 的 影响 。 
3 声音 诱发 闪光 错觉 的 认 知 神经 机 制 
3.1 声音 诱发 内 光 错 觉 的 时 程 机 制 

大 脑 在 接受 视听 信息 的 输入 后 ， 开 始 对 其 进行 整合 加 工 。 那 么 大 脑 在 接受 
声音 诱发 闪光 错觉 任务 中 的 视听 刺激 后 的 不 同 阶段 是 如 何 加 工 这 些 视 听 刺 激 ， 
进而 产生 不 同 的 错觉 ? 研究 者 们 通过 使 用 具有 高 时 间 分 辩 率 的 脑 电 技术 (EEG 和 
ERP) 和 脑 磁 图 技术 (MEG) 针 对 这 一 问题 进行 了 探讨 。 研 究 结 果 均 表明 ， 声 音 诱 
发 闪光 错觉 中 的 视听 觉 信 息 整 合 发 生 在 认 知 加 工 的 早期 阶段 。 

Shams 等 人 (2001) 使 用 ERPs 通过 视觉 诱发 电位 (VEPs) 探 究 了 裂变 错觉 这 种 
跨 通 道 整 合 现象 对 视 知觉 产生 的 影响 是 否 在 通道 特定 的 (modality-specific) 视 觉 
通路 。 研 究 对 比 了 有 声音 出 现 的 VEPs 和 没有 声音 呈现 的 VEPs。 结 果 发 现 ， 这 
些 跨 通道 效应 发 生 在 枕 叶 皮层 。 更 重要 的 是 ， 有 裂变 错觉 闪光 的 VEPs 与 真实 闪 
光 刺 激 的 VEPs 相似。 结果 表明 ， 在 视觉 皮层 中 产生 的 这 两 种 知觉 现象 有 着 类 
似 的 大 脑 机 制品 。 此 外 ，Shams 等 人 (2002) 采 用 y 频段 (gamma band) (>30Hz) 振 
荡 反 应 来 进一步 探究 声音 诱发 闪光 错觉 现象 与 无 错觉 现象 的 神经 基础 。 通 过 记 
录 ERPs 发 现 ， 有 错觉 闪光 现象 出 现时 Y 频段 振荡 显著 高 于 没有 错觉 现象 发 生 的 
试 次 ， 并 且 视 听 交 互 作 用 只 发 生 在 错觉 试 次 中 。 因 此 ， 这 些 结果 表明 了 声音 三 
以 调节 视觉 皮层 区 域 的 加 工 ， 而 调节 的 强度 可 以 影响 最 终 知 觉 输出 中。 同样 地 ， 
Shams 等 (2005) 使 用 MEG 考察 了 声音 对 视觉 的 调节 及 机 制 ， 结 果 发 现 ， 枕 顶 叶 
皮层 位 置 在 视觉 刺激 开始 的 35~65 毫秒 就 已 经 受到 了 调节 ， 在 刺激 后 不 久 (~150 
毫秒 )， 杭 时、 项 叶 以 及 前 部 区 域 的 活动 也 被 调节 5 。Mishra 等 人 (2007) 采 用 
ERPs 对 声音 诱发 闪光 错觉 进行 了 神经 层面 的 研究 。 研 究 主要 采用 了 不 同 数量 的 
视觉 刺激 (0、1 和 2) 与 不 同 数量 的 听觉 刺激 (0、1 和 2) 组 合 ， 其 中 一 个 视觉 刺激 
和 两 个 听觉 刺激 呈现 时 ， 有 两 种 不 同 的 情形 (“ 听 - 视 - 听 ”与 “ 听 - 听 - 视 ”)。 研 究 
发 现 ， 裂 变 错 觉 在 第 二 个 听觉 声音 呈现 30~60ms 后 产生 了 对 视觉 皮层 活动 幅度 
的 早期 调节 中 BEG Mishra 等 (2008) 利 用 ERPs 研究 了 融合 错觉 的 加 工 阶 段 特 
性 。 结 果 发 现 ， 融 合 错觉 在 第 二 个 闪光 呈现 80~112ms 后 产生 了 对 视觉 皮层 活动 
EEKE, Ah, Balz 等 (2016) 对 精神 分 裂 (SCZ) 组 和 健康 (HC) 组 进行 
了 脑 电 图 记录 ， 考 察 了 声音 诱发 内 光 错 觉 中 的 神经 振荡 和 ERPs。 结 果 发 现 ， 与 
单一 视觉 刺激 同时 出 现 的 多 个 听觉 刺激 可 以 诱发 多 个 视觉 刺激 的 错觉 。ERPs 结 
果 显 示 ， 与 HC 相 比 ， 刺 激 开始 后 约 135 ms SCZ 的 振幅 减 小 ， 多 感觉 信息 加 工 
产生 改变 。 此 外 ， 与 HC 相 比 ， 神 经 振荡 的 分 析 表 明 SCZ 的 枕 叶 区 域 在 


100~150ms 后 变化 为 25-35 Hz", WEI, Kaiser 等 人 (2019) 采 用 逻辑 回归 模型 
考察 了 声音 诱发 内 光 错 觉 中 单 次 试验 前 刺激 振荡 脑 活 动 和 视听 跨 通道 影响 之 间 
的 关系 。 研 究 发 现 ， 在 刺激 开始 前 0.17~0.05 s， 枕 叶 电 极 在 25-41 Hz 之 间 功 率 
的 增加 可 以 预测 随后 出 现 的 错觉 感知 。 在 错觉 试 次 和 非 错觉 试 次 之 间 ， 对 显著 
性 聚 类 的 功率 值 进行 + 检验 ， 结 果 显 示 在 错觉 试 次 中 功率 更 高 。 研 究 表明 ， 单 
次 试验 振荡 活动 可 以 预测 多 感觉 信号 的 整合 。 表 明了 所 观察 到 的 功率 调节 预先 
处 理 了 视听 信和 号 的 整合 ， 为 刺激 前 振荡 在 多 感觉 加 工 中 的 文 配 作用 提供 了 进 一 
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32 声音 诱发 闪光 错觉 的 脑 区 

大 脑 在 加 工 声音 诱发 内 光 错 觉 范 式 中 的 视听 觉 信 息 时 ， 另 外 一 个 重要 的 的 
问题 是 哪些 脑 区 参与 了 加 工 以 及 这 些 脑 区 如 何 进行 加 工 ? 研究 者 采用 高 空间 分 
辩 率 的 功能 性 磁 共 振 成 像 (MRI)、 经 颅 直流 电 刺 激 (tDCS)、 经 颅 磁 刺激 技术 
(TMS) 和 脑 磁 图 (MEG) 等 技术 针对 这 一 问题 进行 研究 。 研 究 结果 表明 ， 声 音 诱 
发 闪光 错觉 中 的 视听 觉 信息 整合 可 以 发 生 在 枕 叶 视觉 皮层 、 蜂 上 沟 、 上 丘 、 前 
额 叶 和 小 脑 等 广泛 区 域 均 参 与 加 工 了 声音 诱发 内 光 错 觉 。 

Watkins 等 人 (2006) 通 过 视网膜 皮层 映射 图 (retinotopic mapping) 的 方法 考察 
了 声音 诱发 裂变 错觉 是 否 可 以 发 生 在 早期 的 视觉 皮层 区 域 。 结 果 表 明 ， 声 音 
变 了 被 试 知觉 ， 反 映 的 是 被 试 的 主观 知觉 而 不 是 物理 刺激 ， 并 发 现 裂 变 错 觉 在 
初级 视觉 皮层 (V1) 有 着 更 高 的 激活 水 平 叶 。 相 反 ， 他 们 关于 融合 错觉 的 研究 发 
现 ， 错 觉 性 视觉 闪光 在 V1 皮层 有 着 更 低 的 激活 水 平 中 。 此 外 ， 经 过 全 脑 分 析 
后 发 现 ， 被 激活 的 大 脑 区 域 还 包括 显 上 沟 (superior temporal sulcus). E Fr 
(superior colliculus) 。 同 样 地 ，Zhang 和 Chen (2006) 采 用 动态 性 的 fMRI 也 发 现 
了 声音 诱发 裂变 错觉 发 生 在 早期 的 视觉 皮层 区 域 ， 并 且 效 应 量 的 大 小 与 视听 刺 
激 间 的 间隔 存在 动态 性 的 关联 ， 除 了 视 黄 质 视觉 感知 外 ， 大 脑 外 围 还 可 能 参与 
高 级 别 的 大 脑 处 理 过 程 中 。 随 后 ，Jiang 和 Han (2007) 采 用 fMRI 技 术 ， 基 于 视 
知觉 的 收益 与 损失 来 探究 声音 诱发 内 光 错 觉 现象 的 神经 机 制 。 研 究 发 现 ， 视 觉 
闪光 伴随 听觉 声音 刺激 同时 呈现 时 听觉 声音 刺激 会 影响 视觉 内 光 的 知觉 ， 当 听 
觉 刺激 数量 大 于 闪光 数量 时 ， 被 试 知觉 到 了 错觉 内 光 ， 即 知觉 收益 (perceptual 
gain); 当 上 听觉 刺激 数量 小 于 闪光 数 量 时 ， 被 试 知觉 到 的 闪光 数 量 减 少 ， 即 知觉 
损失 (perceptual loss)。 结 果 表 明 ， 声 音 诱发 内 光 错 觉 现象 的 变化 是 双向 作用 的 ， 
既 可 以 产生 知觉 收益 ， 又 可 以 产生 知觉 损失 。 在 知觉 内 光 中 错觉 知觉 的 收益 激 
活 了 缘 上 回 (supramarginal gyrus). 、 前 额 叶 皮层 (prefrontal cortex) 和 小 脑 
(cerebellum)， 这 反映 出 了 与 工作 记忆 整合 加 工 相 关联 的 神经 网 络 。 而 知觉 损失 
发 现 相关 的 激活 在 内 侧 枕 叶 皮 层 (medial occipital cortex) E fài (thalamus), 7é45j 
早期 视觉 加 工 相 关 的 大 脑 区 域 “W。 在 磁 共 振 成 像 中 的 结构 成 像 中 ，De Haas 
(2012) 考 察 了 声音 诱发 内 光 错 觉 的 个 体 差异 是 否 与 大 脑 结构 中 的 灰质 体积 差异 
有 关 。 结 果 发 现 ， 当 初级 视觉 皮层 局 部 (BA17&18) 的 灰质 体积 较 小 时 ， 被 试 更 
容易 知觉 错觉 吕 。 

此 外 ，Bolognini 等 人 (2011) 通 过 tDCS 改变 (增加 或 减少 ) 视 听 刺 激 交 互 的 可 
能 性 。 研 究 发 现 ， 通 过 tDCS 上 调 或 下 调皮 层 兴 奋 性 可 以 促进 或 减少 错觉 量 ， 
并 且 发 现 显 、 枕 皮层 区 域 与 声音 诱发 内 光 错 觉 存 在 相关 区 。 近 期 ，Maccora 等 
人 (2019) 在 偏 头 痛 患 者 的 视觉 皮层 上 应 用 阴极 tDCS， 以 恢复 他 们 对 裂变 错觉 的 
生理 敏感 性 。 结 果 发 现 ，tDCS 无 法 可 靠 地 调节 偏 头 痛 患 者 的 声音 诱发 闪光 错觉 。 
原因 可 能 是 因为 阴极 tDCS 对 偏 头 痛 患 者 皮层 兴奋 性 缺乏 作用 :9 。Kamke 等 人 


(2012) 使 用 TMS 研究 发 现 ， 角 回 等 顶 叶 网 络 在 有 裂变 错觉 中 起 到 了 整合 听觉 和 视 
ae RUIT ER] S". Shams 等 (2005) 使 用 MEG 来 研究 声音 对 视觉 的 调节 及 背后 的 
机 制 发 现 ， 枕 顶 叶 皮层 位 置 在 视觉 刺激 开始 的 35-65 ms 就 已 经 受到 了 调节 ， 在 
刺激 后 不 久 (~150 毫秒 )， 枕 叶 、 顶 叶 以 及 前 部 区 域 的 活动 也 被 调节 "”。Keil 等 
人 (2013) 使 用 MEG 研究 发 现 ， 在 产生 错觉 之 前 ， 左 侧 蜂 中 回 和 听觉 区 域 之 间 的 
6B 波段 相位 同步 性 增强 ， 而 视觉 区 域 的 相位 同步 性 减弱 中。Chan 等 人 (2017) 在 
记录 MEG 的 同时 ， 要 求 被 试 完成 声 诱 发 的 闪光 错 觉 任务 。 结 果 发 现 ， 与 年 轻 
人 相 比 ， 老 年 人 在 呈现 裂变 错觉 中 显示 出 增强 的 B 波 带 状 前 刺激 ， 这 表明 对 将 
呈现 的 刺激 产生 了 预测 。 传 递 炉 分 析 和 前 刺激 脑 磁 图 数据 的 动态 因果 模型 显 
示 ， 与 年 轻 人 相 比 ， 老 年 人 的 听觉 和 视觉 皮层 之 间 的 跨 通道 连接 具有 更 强 的 与 
错觉 相关 的 调节 '*。 

目前 对 声音 诱发 内 光 错 觉 的 神经 机 制 研究 主要 基于 单一 感觉 皮层 ， 如 初级 
视觉 皮层 和 听觉 皮层 。 随 着 研究 的 不 断 深入 ， 越 来 越 多 的 研究 发 现 声 音 诱发 内 
光 错 觉 不 仅 发 生 在 单一 感觉 皮层 ， 也 有 多 种 脑 区 的 交互 作用 ， 进 一 步 明确 以 及 
发 展 了 声音 诱发 闪光 错 觉 的 神经 机 制 ( 表 1)。 但 从 表 1 中 可 以 看 出 ， 目 前 关于 声 
音 诱发 内 光 错 觉 的 神经 机 制 研究 在 实验 设计 、 实 验 参数 等 问题 上 还 存在 着 不 统 
一 ， 因 此 研究 结果 之 间 也 存在 一 些 差 异 。 未 来 的 研究 应 该 整合 相关 研究 进一步 
考察 声音 诱发 闪光 错 觉 的 神经 机 制 ， 并 且 可 以 在 传统 分 析 的 基础 上 ， 结 合 功能 
连通 性 的 分 析 ， 以 及 结合 静 息 态 和 结构 像 的 数据 进行 相关 预测 性 分 析 来 进一步 
探讨 声音 诱发 内 光 产 生 的 机 制 。 

表 1 声音 诱发 内 光 错 觉 效 应 的 认 知 神经 机 制 研究 
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ms; M. E1 
e in AIV1, AIVIA2V2, AIVIA2, Al T SDS 128 ja 
(2008) 错 VIV2 中 SOAww=10 ms; 产生 了 对 视觉 皮层 活 
觉 动 幅 度 的 早期 调节 作 
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AoVix AoV2. Ai 
Vi. AsVo AoV2 
. AMI 


Viv Va AiVin 
AV AiV2, A2 
V2 


Vi. Va AV: 


Va Vs. A3V3. 
AsV;、 AsV;、 A3 
Vs 


Viv Va AVV 
AsVi、 AliV2:、 LV 
V2 


Vi. Vo. V3. Va 
~ Ai. AV 


AlA2VI: SOA(:v1,7200 mso 


声音 刺激 : 1 kHz 频率 ，73 分 贝 声 
压 级 ， 呈 现 7 ms; 
闪光 刺激 : 呈现 在 中 央 注 视点 下 方 
41°, H4% 1.65, EÈ 89 cd/m’ WA 
色 闪 光 ， 呈 现 10 ms; 

时 间 间 隔 : AVi 中 SOAwivn=0 ms; 
SOA((vi42757 mso 


声音 刺激 : 3.5 kHz 频率 ，95 分 贝 声 
压 级 ， 呈 现 10 ms; 

闪光 刺激 : 呈现 在 背景 为 灰色 (30 
cd/m?) ， 亮 度 420 cdm2， 中 央 注 视 
点 下 方 8.$~10? 的 环 状 带 ， 呈 现 17 

ms; 

时 间 间 隔 : ISIvivw=56 ms. 

声音 刺激 : 3.5 kHz 频率 ，95 分 贝 声 
Jka, = 10 ms; 

闪光 刺激 : 呈现 在 背景 为 灰色 (30 
cd/m?) ， 亮 度 420 cd/m?, PEA 
点 下 方 8.5~10° 的 环 状 带 ， 呈 现 17 

ms; 

时 间 间 隔 : ISI=46 ms; SOA aia2=56 
ms; SOAwiv2=63 ms. 


声音 刺激 : 1.7 kHz 频率 ， 呈 现 7 


闪光 刺激: 呈现 17 ms; 
时 间 间 隔 : ISIvivw=50 ms; 
ISIaivi725 MSo 


声音 刺激 : 2 kHz 频率 ，80 分 贝 声 
压 级 ， 呈 现 7 ms; 

闪光 刺激 : 呈现 在 背景 为 黑色 ， 中 
央 注 视点 下 方 4.8?， 直 径 1.6%， 亮 
度 204 cd 的 白色 闪光 ， 呈 现 17 
ms; 
IN TATA: A3V3. AsV54 
SOAaivn=23 ms; 

AsVs.. AsV; P SOA 145760 ms; 
AV; A3Vs P SOA1457120 mso 
声音 刺激 : 3.5 kHz 频率 ，65 分 贝 声 
Hea, ZH 20 ms; 

闪光 刺激 : 呈现 在 背景 为 灰色 〈90 
cd/m?) ， 中 央 注 视点 上 方 或 下 方 
5"， 直 径 2"， 亮 度 140 cd/m? 的 白色 
闪光 ， 呈 现 24 ms; 

时 间 间 隔 : ISIvivw=34 ms. 

声音 刺激 : 80 分 贝 声 压 级 ， 呈 现 13 


TS 


L 


用 


ERPs 结果 表明 刺激 
开始 约 135 ms 后 
SCZ 个 体 的 振幅 减 小 ， 
神经 振荡 结果 表明 
SCZ 被 试 枕 叶 区 域 在 
刺激 开始 约 
100~150ms 后 变化 为 
25~35 Hz 
刺激 开始 前 170 秒 至 
50 秒 ， 枕 叶 电 极 25 
至 41 Hz 之 间 的 功率 
增加 ， 可 以 预测 随后 
出 现 的 错觉 感知 


p 


声音 改变 了 被 试 的 主 
观 知觉 ， 裂 变 错觉 可 
以 发 生 在 初级 视觉 皮 
Es AN EAA a 
上 海区 域 的 活动 增强 


融合 错觉 在 视觉 皮层 
为 负 激活 ， 在 矣 上 淘 、 
LENERS 


ISIaivi725 ms 时 ， 

真实 单 次 闪光 相 比 ， 
变 错觉 中 视觉 上 皮 
中 的 fMRI 信号 显 


变 错觉 发 生 在 早期 
觉 皮 层 ， 且 效 应 
的 大 小 与 视听 刺激 
的 间隔 存在 动态 性 
的 关联 


z Ep mE AS me ND AS dT E 
puis 
wu 
pan 


m 


知觉 收益 时 激活 左 侧 
缘 上 回 、 左 侧 前 额 叶 
皮层 和 右 侧 小 脑 ， 在 
知觉 损失 时 激活 内 侧 
枕 叶 皮层 和 丘脑 


BA17&18 的 灰质 体 
积 较 低 时 ， 更 容易 感 
知 到 错觉 


通过 tDCS 上 调 或 下 
调皮 质 兴 奋 性 可 以 调 


闪光 刺激 ， 呈 现在 背景 为 黑色 ， 中 
i "— 440. IRF TEE, XA. TE 
Mancini, & 错 TT 央 注 视点 下 方 3"， 直 径 2"， 亮 度 pis peo ira 
Vallar H ao AN Ai 118 cd/m WAEA, 530 13 HEURT aE 
(2011) 觉 Vos AiV3. AV; Men B ”除外 ) 与 闪光 错觉 存 
mss 时间 间隔 : SOA aivy=26 ms; 在 功能 相关 
SOAwiv2=65 ms; SOA(145,752 mso 
声音 刺激 : 3.5 kHz 频率 ，80 分 贝 声 
4 EE] : 
A nd 右 侧 角 回 改变 了 刺激 
闪光 刺激 : 呈现 在 背景 为 黑色 ， 中 ARD 
Kamke AF TMS Vi. Va AVi 央 注 视点 左 侧 或 右 侧 8°, HBH 2° 驱动 的 注意 力 网 络 ， 
(2012) 错 AoV, tage IA. ELD , 降低 了 视听 刺激 错误 
os 的 白色 闪光， 呈现 20 ms; 整合 的 可 能 性 
时 间 间 隔 : SOAwiv»=70 ms; H SE 
SOAwiax=70 ms; SOAwian=160 ms 
Vir Va V3. Va 
LI 频率 ，80 分 贝 声 TEN 
~ An Ax Az 声音 刺激 : 3.5 kHz 频率 ，80 分 贝 声 枕 顶 叶 皮 层 区 域 在 视 
Asn AV AV JRC, Æ IO ms; Ls ls TE fies 
Shams, 内 SED aS a 46.1. Bg £r 觉 刺 激 开 始 的 35~65 
3 s AiV3, AIV. 闪光 刺激 : 呈现 在 背景 为 黑色 ， 中 = gps 
Ma, & HK ey ! > ms 受到 了 调节 ， 在 
. M MEG AVi A:V& A 央 注 视点 下 方 12*， 直 径 1.5° 的 白色 
Beierholm 错 央 注 视点 刺激 后 约 150 ms, 4t 
(2005) i Vs. AVa AV N 光 a 10 ms; 叶 、 顶 叶 以 及 前 部 区 
、 A3V». A3V3, FRY [R] [H [8 SOAwivy=70 ms; 域 的 活动 也 被 调节 
re AsVa, A4Vi. Ag SOA(142,758 ms * H 
= V» AgvV3, A4V4 
Keil, 闪 声音 刺激 : 呈现 7 ms; 在 产生 错觉 之 前 ， 左 
Müller, 光 Viv Va An Ao ”闪光 刺激 : 呈现 17 ms; 侧 晒 中 回 和 听觉 区 域 
Hartmann, 4 MEG 、AIV AiV;、 时 间 间 隔 : ISIwvivw=50 ms; 之 间 的 了 波段 相位 同 
& Weisz i AoVi, AoV2 SOA aian=64 ms; 步 性 增强 ， 而 视觉 区 
(2013) ds SOAwvwr67 ms. 域 的 相位 同步 性 减弱 
E z THI VI py se 
声音 刺激 : 3.5 kHz 频率 ，65 分 贝 声 
年 人 对 将 FA yl EK 
ie Vis Va An Ay cera em. di dede Et 刺激 产生 了 预测 ， 视 
Chan 变 MEG AM. AV 闪光 刺激 : 呈现 在 背景 为 黑色 ， 中 听 皮 层 的 跨 通道 连接 
(2017) 错 AN, Mess 央 注视 点 下 方 44， 直 径 2° 的 白色 内 对 与 错觉 相关 的 调节 
觉 光 ， 星 现 16 ms; 能 力 更 强 
时 间 间 隔 ; SOA=50~100 ms. 


"TG 4 总 结 与 展望 
= 声音 诱发 闪光 错觉 效应 反映 了 视听 觉 信息 整合 过 程 中 听觉 信息 对 视觉 信息 
感知 的 影响 。 本 文 对 声音 诱发 闪光 错觉 效应 的 研究 进行 了 系统 性 梳理 ， 主 要 包 
括 : (1) 声 音 诱发 闪光 错觉 被 试 内 差异 的 影响 因素 ， 包 括 自 下 而 上 的 物理 刺激 因 
素 ( 刺 激 空 间 特 性 、 刺 激 强 度 差异 和 刺激 间 的 时 间 间 隔 ) 和 自 上 而 下 的 认 知 因素 
(注意 分 配 、 内 源 性 注意 、 反 馈 方式 和 认 知 期 望 ) 等 ， 还 包括 视听 刺激 依赖 程度 、 
视听 刺激 整合 的 发 展 以 及 视听 刺激 知觉 敏感 性 等 造成 被 试 间 差异 的 因素 。(2) 声 
音 诱 发 闪光 错觉 的 认 知 神经 机 制 ， 包 括 采 用 EEG. ERP fü MEG 等 手段 考察 的 
视听 整合 过 程 的 早期 加 工 阶段 ， 以 及 采用 MRI、tDCS、TMS 和 MEG 等 手段 发 
现 的 枕 叶 视觉 皮层 、 里 上 沟 、 上 丘 、 前 额 叶 和 小 脑 等 广泛 加 工 声音 诱发 闪光 错 
觉 的 脑 区 。 自 声音 诱发 闪光 错觉 效应 被 发 现 以 来 ， 研 究 者 们 开展 了 大 量 的 研究 
通过 对 本 文 的 综述 ， 不 但 能 够 系统 地 了 解 声音 诱发 闪光 错觉 效应 及 其 机 制 ， 同 
时 也 能 够 为 视听 整合 类 的 相关 研究 提供 借鉴 。 

目前 声音 诱发 内 光 错 觉 的 研究 还 存在 一 些 局 限 和 不 足 。 比 如 目前 仅 限于 上 自 
身 机 制 探讨 ， 即 一 方面 是 影响 因素 类 研究 ， 一 方面 是 神经 机 制 类 研究 。 尚 待 解 
决 的 是 将 声音 诱发 闪光 错觉 的 研究 与 其 他 视听 整合 类 的 研究 进行 比较 ， 探 究 声 
音 诱 发 闪光 错觉 和 其 他 视听 整合 类 研究 的 共性 问题 ， 以 及 声音 诱发 闪光 错觉 相 
对 于 其 他 视听 整合 类 研究 的 特异 性 的 问题 ， 为 视听 整合 其 至 多 感觉 整合 的 相关 


o 


研究 提供 更 多 实证 性 的 文 持 。 下 面 将 结合 己 有 研究 的 不 足 ， 提 出 未 来 研究 的 可 
能 性 的 方向 。 

第 一 ， 注 意 对 声音 诱发 内 光 错 觉 的 影响 。 未 来 的 研究 可 以 在 实验 研究 中 系 
统 地 调节 不 同 刺激 的 竞争 程度 ， 例 如 通过 操纵 知觉 负载 操纵 自 上 而 下 的 注意 ， 
考察 其 对 多 感觉 整合 产生 的 影响 20。 也 可 以 在 现 有 多 感觉 整合 与 注意 交互 作用 
研究 的 基础 上 名 ， 探 讨 不 同 注意 模式 下 的 声音 诱发 闪光 错 觉 效 应 。 一 方面 为 影 
响声 音 诱 发 风光 错觉 在 被 试 内 差异 的 因素 提供 更 多 来 自 注意 这 一 因素 的 实证 研 
究 ， 另 一 方面 也 能 够 为 视听 整合 类 的 研究 提供 来 自 不 同感 觉 通 道 权 重 不 同情 况 
下 产生 的 感觉 主导 效应 的 证 据 支 持 。 

第 二 ， 奖 赏 对 声音 诱发 内 光 错 觉 的 影响 。Rosenthal 等 人 (2009) 采 用 Shams 
等 人 (2002) 的 研究 范式 发 现 ， 在 给 予 被 试 货币 奖励 时 可 以 降低 被 试 知觉 到 的 错 
觉 闪 光 2 呈 ， 但 具体 奖励 机 制 为 什么 会 降低 错觉 知觉 ， 没 有 过 多 研究 。 为 什么 奖 
励 可 以 改变 被 试 知觉 ?是 否 和 奖励 机 制 的 神经 基础 有 关 ? 那么 高 奖励 和 低 奖 励 是 
否 对 被 试 知 觉 错觉 有 不 同 影响 ?未 来 研究 可 以 通过 操纵 奖赏 的 量化 等 方式 进 一 
步 考 察 奖 赏 对 声音 诱发 风光 错觉 的 影响 ， 一 方面 为 影响 声音 诱发 内 光 错 觉 在 个 
体内 变异 的 因素 提供 更 多 来 自 奖 赏 这 一 因素 的 实证 研究 ， 另 一 方面 也 能 够 为 奖 
赏 如 何 影响 视听 整合 加 工 提供 来 自 听 觉 主 导 效 应 方向 的 证 据 文 持 。 

第 三 ， 视 听 整 合 的 方式 对 声音 诱发 内 光 错 觉 的 影响 。 以 往 关 于 声音 诱发 内 
光 错 觉 效 应 的 研究 均 认 为 错觉 效应 的 出 现 是 由 于 视听 刺激 在 整合 的 过 程 中 大 脑 
对 视觉 通道 和 听觉 通道 分 配 的 权重 不 一 致 ， 导 致 整合 的 过 程 中 出 现 了 听觉 通道 
信息 的 加 工 主导 了 视觉 通道 信息 的 加 工 位 "。 但 到 底 声 音 诱发 闪光 错觉 效应 是 
由 于 整合 过 程 中 出 现 了 感觉 通道 的 主导 ， 还 是 由 于 在 视觉 通道 信息 和 听觉 通道 
言 息 在 输入 的 过 程 中 各 个 通道 中 信息 加 工 的 差异 导致 的 ， 目 前 还 不 能 确定 。 未 
来 研究 可 以 关注 单 通道 的 视觉 刺 激 和 单 通道 的 听觉 刺激 的 加 工 在 声音 诱发 内 光 
音 觉 中 所 起 到 的 作用 ， 一 方面 能 够 明确 在 声音 诱发 内 光 错 觉 中 视觉 与 听觉 输入 
的 信息 是 先 得 到 整合 以 后 才 在 脑 区 进一步 加 工 ， 还 是 在 进入 脑 区 之 前 单 通道 就 
已 经 加 工 对 应 的 信息 然后 进一步 整合 的 。 另 一 方面 也 能 够 考察 声音 诱发 办 光 错 
觉 这 种 视听 整合 现象 与 其 他 视听 整合 现象 的 共性 与 特性 。 

第 四 ， 声 音 诱 发 内 光 错 觉 对 记忆 和 学 习 等 认 知 过 程 的 影响 。 目 前 声音 诱发 
闪光 错觉 的 研究 主要 集中 在 影响 因素 和 神经 机 制 层 面 的 探讨 ， 很 少 关 注 声音 诱 
发 闪光 错 觉 效应 如 何 影响 后 续 的 认 知 加 工 过 程 。 例 如 ，Quak 等 人 (2015) 认 为 多 
感觉 通道 信息 加 工 的 方式 能 够 很 好 地 理解 工作 记忆 如 何 存储 和 操纵 信息 ""。 也 
有 一 系列 的 相关 研究 对 此 问题 进行 了 探究 ， 证 实 了 多 感觉 整合 加 工 过 程 有 助 于 
工作 记忆 的 编码 和 提取 ”。 因 此 ， 未 来 研究 可 以 考察 声音 诱发 闪光 错觉 这 种 
听觉 主导 效应 类 的 视听 整合 对 工作 记忆 以 及 学 习 的 影响 ， 一 方面 能 够 考察 声音 
诱发 内 光 错 觉 这 种 视听 整合 现象 与 其 他 视听 整合 现象 的 共性 与 特性 。 男 一 方面 
也 能 够 扩展 声音 诱发 内 光 错 觉 的 研究 角度 和 思路 。 

第 五 ， 应 用 计算 模型 探讨 声音 诱发 内 光 错 觉 的 神经 机 制 。 以 往 的 研究 从 计 
算 模 型 的 角度 对 视听 整合 中 经 典 视觉 主导 效应 (McGurk 效应 ) 机 制 进行 了 解释 
09576， 比如 分 层 预测 编码 模型 趾 以 及 差异 噪声 编码 模型 (noisy encoding of 
disparity model, NED)"”。 在 应 用 计 计 算 模型 的 过 程 中 党 试 先 假定 其 中 的 加 工 过 
程 ， 并 利用 不 同 的 参数 来 描述 不 同 的 加 工 过 程 ， 参 数 在 其 中 代表 的 意义 与 特定 
加 工 过 程 相 对 应 5 。 但 目前 很 少 有 声音 诱发 闪光 错觉 效应 的 研究 将 神经 生理 技 
术 与 计算 模型 相 结合 。 现 有 的 一 项 关于 声音 诱发 内 光 错 觉 的 计算 模型 研究 通过 


一 个 由 两 层 视觉 和 听觉 神经 元 组 成 的 简单 神经 网 络 考察 声音 诱发 内 光 错 觉 中 的 
视听 交互 过 程 " 。 未 来 的 研究 可 以 关于 声音 诱发 内 光 错 觉 效应 的 计算 模型 研究 
可 以 考虑 结合 分 层 预测 编码 模型 和 差异 噪声 编码 模型 ， 利 用 EEG/ERP. fMRI 
结果 等 神经 科学 指标 进行 参数 拟 合 ， 或 是 神经 科学 研究 可 以 考虑 利用 计算 模型 
寻找 相应 参数 的 对 应 脑 区 ， 为 模型 的 参数 找到 神经 基础 。 
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Abstract: Sound-induced Flash Illusion (SiFI) is an auditory- 
dominated multisensory integration phenomenon that occurs when 
flashes presented in conjunction with an incongruent number of 


auditory sounds results in the flashes being perceived as equal in 
number to the auditory sounds. Here we summarize several factors that 
could impact on SiFI: (1) Bottom-up variance factors comprising 
physical properties (i.e., spatial characteristics of stimuli, 
differences in stimulus intensity, and time interval between 
audiovisual stimuli), top-down variance factors comprisingcognitive 
processes (i.e., attention, feedback patterns, and cognitive 
expectations), and between-subjects variance factors, such as the 
dependence for audiovisual stimuli, the ability to integrate 
audiovisual stimuli, and perceptual sensitivity to audiovisual 
stimuli; (2) Cognitive processing stages and neural mechanisms of 
SiFI (i.e., related brain regions). Future studies should focus on 
the effects of cognitive processes such as attention, reward, 
audiovisual integration on SiFI. The effects of SiFI on memory and 
learning should also be explored in future research. In addition, 
future studies combining computational models and neuroscience should 
further explore the cognitive and neural mechanisms of SiFI. 


Key words: sound induced flash illusion (SiFI); fission illusion; 
fusion illusion; multisensory integration 
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